2003年06月18日
川俣晶の縁側辛口甘口雑記 total 2385 count

XMLとUnicodeは“混ぜるな危険”?

Written By: 川俣 晶連絡先

 こんな記事が良く出てくるものだな、と思いますが。

XMLとUnicodeは“混ぜるな危険”?

https://www.zdnet.co.jp/news/0306/18/xert_xmlunicode.html

 Unicodeが持っている機能と、マークアップ言語が持っている機能に重複があるというのは、昔から分かっていたことです。

 マークアップ言語が持つべき機能をUnicodeに入れるな、という批判も最初からありました。重複するとトラブルが起きるのは明らかですから。たとえばUnicodeの言語タグとXMLのxml:lang属性などですね。それらが矛盾した情報を示していた場合、どう解釈すれば良いのか。

 その答は何年も前に出ていて、XML側の情報を使うということになっていたはずです。そのような意味で、この手の話題は新たに明らかになった話でも何でもないです。それを、センセーショナルに報道して誤解を深めることが、本当に意味があるのかどうか。

 もう1つ、「互換性文字」という言葉が出てきますが、これは「互換文字(compatibility character)」ですね。これらは、あくまで互換のために用意されたものであって、必要なければ使わないのが当然というものです。ですから、互換性を要求されてやむを得ず使い人以外は、本来なら、関係のない話ですね。

 ちなみに、半角カナ、全角アルファベットも互換文字です、これらは、使わない方が良い文字です。半角と全角の混迷の話題はいずれ機会を見て書くかも知れませんが、同じ文字に複数のバリエーションがあることはトラブルの元です。そういうものは排除していく方が望ましいと言えます。まあ、互換のためにどうしても必要というケースがあるのも事実です。ですが、互換の問題もないのに、半角カタカナを多用する表現手法を新たに作って使っていくことは、イマイチ、そういう流れに乗れてないことだと言えます。